import pandas as pd
data=pd.read_excel('2020年销售数据.xlsx')
print(data.head())
#清洗
for c in data.columns:
    if data[c].hasnans:
        print(c)
        break
    else:
        print(False)
print(data.size)
data=data.drop_duplicates('销售订单')
print(data.size)
#计算销售额
data['销售额']=data['售价']*data['销售数量']
print(data.head())
#销售额的平均数
print(f"{data['销售额'].mean():.2f}")
#销售数量最多的订单号
print(data.nlargest(1,'销售数量')['销售订单'].squeeze())

#天猫平台所有订单的销售额的中位数
print(data[data['销售渠道']=='天猫']['销售额'].median())

